草庐IT

对 ChatGLM-6B 做 LoRA Fine-tuning

全部标签

ChatGLM-6B的windows本地部署使用

ChartGPT最近特别火,但是收费,而且国内访问不太方便,所以找了个类似的进行学习使用ChatGLM-6B,开源支持中英文的对话大模型,基于GeneralLanguageModel(GLM)架构,具有62亿参数,简单说非常不错,可能和chartGPT比较有些差距,但是开源免费,并且可以在本地部署,支持中文,这就很nice了首先安装环境,当前本机电脑win10,pycharm2020,python3.9,Anaconda3。文章涉及到的相关资源会在文章最下面公共号中提供,这里也注意,部分软件根据电脑本身需要改动版本安装1、需要安装CUDA和cudnn由于要使用GPU(不用也可以,不过是有点慢)

Bard isn’t currently supported in your country. Stay tuned!

一、问题说明在注册GoogleBard账号的时候,出现报错:“Bardisn’tcurrentlysupportedinyourcountry.Staytuned!”意思就是:目前所在国家不支持Bard,敬请期待!二、解决方案1)梯子(VPN)国家切换到“美国”;2)注册的邮箱使用gmail邮箱。注册成功后,登录效果如下:

常见大模型对比[ChatGPT(智能聊天机器人)、Newbing(必应)、Bard(巴德)、讯飞星火认知大模型(SparkDesk)、ChatGLM-6B]

目录1引言2选取常见的大模型作为对比项2.1什么是大模型2.2常见大模型3相关的大模型介绍和功能3.1ChatGPT3.1.1ChatGPT的介绍3.1.2ChatGPT的原理3.1.3ChatGPT的特点3.2Newbing3.2.1Newbing的介绍3.2.2GPT-4的原理3.2.3Newbing的特点3.3ChatGLM-6B3.3.1ChatGLM的介绍3.3.2ChatGLM的原理3.3.3ChatGLM-6B的特点3.4文心一言3.4.1文心一言的介绍3.4.2文心一言的原理3.4.3文心一言的特点3.5讯飞星火认知大模型3.5.1讯飞星火认知大模型的介绍3.5.2讯飞星火认知

ChatGLM-6B详细学习实践记录与资料分享

随着年初chatGPT产品的退出和迭代发展,凭借一己之力将大模型带火,国产很多厂商后续也陆续跟进开始投入研发属于自己的大模型产品,在这段时间里面陆陆续续出来了很多不同的产品,比如:文心一言、星火大模型、通义千问、商量、360智脑、MOSS等等,这些大都是排队申请注册,迟迟等不到体验通过的结果,在开源层面比较能打的基本就是清华大学开源的chatGLM产品了,目前已经经过数个版本的迭代开发了,因为实际项目的需要,我也陆续接触了这个开源项目,本文并不是要去深入剖析,我也没有那个能力,毕竟本身并不是主要做大模型和NLP这个方向的,这里主要的目的就是详细记录自己学习过程中的学习资料已经问题等等,会持续更

从通才到专才:Fine-tuning与Embedding探索

作者|崔皓审校|重楼摘要在自然语言处理领域,为了让模型能够处理特定领域的问题,需要进行Fine-tuning,即在基础模型上训练模型以理解和回答特定领域的问题。在这个过程中,Embedding起到了关键作用,它将离散型的符号转换为连续型的数值向量,帮助模型理解文本信息。词嵌入是一种常用的Embedding方法,通过将每个单词转换为多维向量来捕获其语义信息。本文通过LangChain,ChromaDB以及OpenAI实现Fine-tuning的过程,通过更新Embedding层来让模型更好地理解特定领域的词汇。开篇在自然语言处理领域,最常见的用例之一是与文档相关的问题回答。虽然这方面ChatGP

ChatGLM2-6B安装详解(Windows/Linux)及遇到的问题解决办法

最近ChatGLM-6B发布了第二代ChatGLM2-6B,于是果断部署了一下试试水。下面讲解详细部署过程,并讲解部署时候遇到的问题以及解决办法。一、部署过程1.安装python、git等必须工具在要部署项目之前,需要部署必须的一些工具。下面详细讲解每一步所需的工具安装步骤。1.1安装python对于如何安装python,网上有很多教程,这里只是简单讲解。(1)通过安装anaconda、miniconda安装python可以通过anaconda和miniconda安装虚拟环境的方式安装python,这种安装的好处就是可以切换不同python和各种三方包不同版本。因为很多项目需要的版本不同,会导

ChatGPT进阶:利用Fine-tuning训练自己的模型

前言ChatGPT是“大力出奇迹”的经典表现,大模型给ChatGPT带来了惊人的智能,但是要训练这样的大模型,可是十分烧钱的,根据OpenAI给出的数据,1700亿参数的Davinci模型从头训练一遍,大概需要耗时3个月,耗资150万美元。那我们普通人或者小公司面对这个高门槛,对自定义模型是不是就完全没有希望了呢?其实除了从头训练一个模型,我们还可以选择基于一个基础模型进行训练,这样,我们可以往里添加自己的个性化数据,最终得到一个领域增强的个性化模型,这个技术被OpenAI称为Fine-tuning。个性化模型有什么用?我们知道,OpenAI给的模型(如Davinci、Curie、gpt-3.

windows环境下的langchain-ChatGLM的本地部署

首先是项目开源地址 https://github.com/imClumsyPanda/langchain-ChatGLM下载这个项目的源码非常简单,但运行起来十分麻烦,各种环境的搭配简直是折磨人,尤其是电脑上缺少各种安装环境的,我首先先列举几个,例如conda安装python的虚拟环境,用这个比较方便,还有Anoconda的安装,VisualStudio的安装等等,反正运行时缺少什么,我们就安装什么就完事了。B站有一个类似的本地部署值得参考一下:【防坑指南】手把手演示本机部署langchain+chatGLM本地知识库_哔哩哔哩_bilibili一、跟着B站的这个视频安装下去,我们可能在第一步

Auto-Tuning with Reinforcement Learning for Permissioned Blockchain Systems

文章目录摘要一、介绍二、相关工作2.1总账结构2.2织物优化三、系统结构四、作为DRL问题的自动调谐4.1参数和性能4.2问题的转化4.3RL用于自动调参4.4PB-MADDPG用于自动调参五、重要参数识别六、实验6.1设置6.2执行时间分解6.3调整效果和效率比较6.4参数数量的影响6.5适应性6.6奖励函数的评估6.7容错性的评估6.8总结七、讨论摘要在一个允许的区块链中,性能决定了它的发展,而发展很大程度上受其参数的影响。然而,由于分布式参数带来的困难,关于自动调优以获得更好性能的研究已经有些停滞;因此,很难提出有效的自动调整优化方案。为了缓解这一问题,我们首先探索了Hyperledge

Auto-Tuning with Reinforcement Learning for Permissioned Blockchain Systems

文章目录摘要一、介绍二、相关工作2.1总账结构2.2织物优化三、系统结构四、作为DRL问题的自动调谐4.1参数和性能4.2问题的转化4.3RL用于自动调参4.4PB-MADDPG用于自动调参五、重要参数识别六、实验6.1设置6.2执行时间分解6.3调整效果和效率比较6.4参数数量的影响6.5适应性6.6奖励函数的评估6.7容错性的评估6.8总结七、讨论摘要在一个允许的区块链中,性能决定了它的发展,而发展很大程度上受其参数的影响。然而,由于分布式参数带来的困难,关于自动调优以获得更好性能的研究已经有些停滞;因此,很难提出有效的自动调整优化方案。为了缓解这一问题,我们首先探索了Hyperledge